AI推理优化

首页

AI推理优化

Granite 4.0 Tiny Preview是IBM推出的轻量级语言模型，具备高效计算能力和紧凑结构，支持在消费级GPU上运行多个长上下文任务。采用混合Mamba-2/Transformer架构，结合高效与精准优势，支持无位置编码（NoPE）处理128K tokens上下文。内存需求降低72%，推理时仅激活1B参数，适用于边缘设备部署、长文本分析及企业级应用开发，适合资源受限环境下的AI研究与

AI项目与工具 2025年06月11日 42 点赞 0 评论 554 浏览

AI推理优化 首页 AI推理优化

列表 默认 浏览次数 发布日期

Granite 4.0 Tiny Preview

AI推理优化

首页

AI推理优化

列表

默认

浏览次数

发布日期